Análisis exploratorio

Marta Venegas Pardo

3/8/2022

## [1] 14236   474

Análisis descriptivo

Nuestro conjunto de datos tiene las siguientes dimensiones: 14236, 474. De las 474 variables, 464 de ellas corresponden al valor de la intensidad de señal que llega al movil desde cada punto de acceso inalámbrico WAP y las otras 10 variables corresponden a posición desde donde se ha tomado la señal e identificación del usuario y teléfono móvil utilizado.

Resúmenes descriptivos

Vamos a mostrar los datos a modo de tabla, pero únicamente mostraremos algunas de las variables WAP, ya que son demasiadas.

  • Formato de cada variable:
## 'data.frame':    14236 obs. of  9 variables:
##  $ LONGITUDE       : Factor w/ 679 levels "-7300.818990092725",..: 489 480 441 453 553 468 441 462 499 421 ...
##  $ LATITUDE        : Factor w/ 687 levels "4864745.745015971",..: 514 553 598 551 644 576 598 528 426 593 ...
##  $ FLOOR           : Factor w/ 5 levels "0","1","2","3",..: 3 3 3 3 1 3 3 3 3 3 ...
##  $ BUILDINGID      : Factor w/ 3 levels "0","1","2": 2 2 2 2 1 2 2 2 2 2 ...
##  $ SPACEID         : Factor w/ 123 levels "1","2","3","4",..: 31 31 28 27 47 30 28 26 37 28 ...
##  $ RELATIVEPOSITION: Factor w/ 2 levels "1","2": 2 2 2 2 2 2 2 2 2 1 ...
##  $ USERID          : Factor w/ 18 levels "1","2","3","4",..: 2 2 2 2 11 2 2 2 2 2 ...
##  $ PHONEID         : Factor w/ 16 levels "1","3","6","7",..: 15 15 15 15 8 15 15 15 15 15 ...
##  $ TIMESTAMP       : POSIXct, format: "2013-06-20 09:35:33" "2013-06-20 09:34:51" ...

En primer lugar, vamos a hacer un breve análisis descriptivo de las variables que no corresponden a las señales WAP.

##                LONGITUDE                  LATITUDE     FLOOR    BUILDINGID
##  -7367.458799999207 :   88   4864841.782799996:   88   0:3247   0:3091    
##  -7360.497299998999 :   85   4864837.920500003:   85   1:3582   1:3767    
##  -7312.662200000137 :   82   4864807.624899998:   82   2:3127   2:7378    
##  -7311.919399999082 :   78   4864808.963799998:   78   3:3743             
##  -7345.42330000177  :   75   4864829.557700001:   75   4: 537             
##  -7366.2424000017345:   74   4864841.108000003:   74                      
##  (Other)            :13754   (Other)          :13754                      
##     SPACEID      RELATIVEPOSITION     USERID        PHONEID    
##  107    :  349   1: 2785          11     :3703   13     :3703  
##  104    :  337   2:11451          7      :1353   14     :2028  
##  202    :  324                    1      :1114   6      :1353  
##  106    :  316                    2      :1058   23     :1058  
##  101    :  315                    10     : 893   8      : 893  
##  102    :  303                    14     : 773   7      : 773  
##  (Other):12292                    (Other):5342   (Other):4428  
##    TIMESTAMP                  
##  Min.   :2013-05-30 12:15:24  
##  1st Qu.:2013-06-20 09:35:24  
##  Median :2013-06-20 10:21:10  
##  Mean   :2013-06-17 05:53:31  
##  3rd Qu.:2013-06-20 11:40:49  
##  Max.   :2013-06-20 16:15:45  
## 

Gráficas

Visualización del campus

Análisis de los edificios

Encontramos 3 edificios y 5 plantas diferentes, pero eso no tiene porque indicar que todos los pisos tengan 5 plantas.

Es interesante destacar que la mayoría de mediciones se han tomado en el edificio con identificador 2 y en la posición relativa delante de la puerta, no dentro de las habitaciones.

##      BUILDINGID
## FLOOR    0    1    2
##     0  652  965 1630
##     1  759  898 1925
##     2  882 1105 1140
##     3  798  799 2146
##     4    0    0  537

En la tabla anterior observamos que el único edificio que tiene 5 plantas es el edificio número 2, y que los edificios 0 y 1 tienen 4 únicamente 5 plantas.

Vemos como en el edificio 2 es en el que se han tomado mayor número de mediciones y podría ser debido a que es el que más plantas tiene.

##      BUILDINGID
## FLOOR    0    1    2
##     0  652  965 1630
##     1  759  898 1925
##     2  882 1105 1140
##     3  798  799 2146
##     4    0    0  537

Vemos que con gran diferencia, el edificio 2 es en el que mayor número de mediciones se han realizado.

Análisis de los usuarios

Observamos claramente como hay usuarios que suelen visitar edificios concretos, ya que la inmensa mayoría de los registros que hace son allí, como por ejemplo el usuario 11 en el edificio 0, aunque tambien visita las plantas 3 y 4 del edificio 2.

A continuación vamos a ver en que edificio ha registrado cada usuario el mayor número de visitas

##    USERID count BUILDINGID
## 1       1  1114          1
## 2       2   609          3
## 3       3   192          3
## 4       4   320          2
## 5       5   599          3
## 6       6   583          3
## 7       7   730          3
## 8       8   298          3
## 9       9   265          3
## 10     10   543          3
## 11     11  1977          3
## 12     12   433          3
## 13     13   108          3
## 14     14   572          3
## 15     15   497          3
## 16     16   299          3
## 17     17   524          3
## 18     18   226          3

Número de medidas tomadas por cada usuario:

Vemos que hay un usuario en concreto que registra una cantidad de mediciones muy superior al resto, y este es el usuario número 11, con un total de 3703.

Número de mediciones tomadas por cada usuario en cada edificio

Observamos que los únicos usuarios que han registrado posición en el edificio 0 son el 1 y el 11, pero cabe destacar que el usuario 11 también es el único que ha registrado señal en los tres edificios y el 1 únicamente en el edificio 0.

Conclusión: no todos los usuarios visitan todos los edificios.

Comentar gráfico

Análisis de la posición relativa

Vamos a estudiar a continuación como ha variado el número de mediciones en función de la posición relativa de la toma.

Podemos observar como la mayoría de las mediciones han sido tomadas delante de la puerta, y son mucho menos las que han sido tomadas dentro de las habitaciones.

Análisis del espacio

Vamos a hacer un análisis de identificación de los espacios, y así poder ver si todos los edificios tienen los mismos espacios o se identifican unívocamente para cada edificio.

Identificación de los espacios según el edificio.

Aquí podemos ver el número de espacios que hay en cada edificio, y lo que nos hace pensar que no todos los edificios son igual de grandes, ya que el número de espacios del edificio 1 es inferior al resto, siendo el edificio 2 el que mayor número de espacios tiene, sobre todo en la planta 3.

¿Se repite el número de salas en función del edificio o cada edificio tiene sus propias salas?

##        BUILDINGID
## SPACEID   0   1   2
##     1     0  42   0
##     2     0  69   0
##     3     0  64   0
##     4     0  72   0
##     5     0  48   0
##     6     0  56   0
##     7     0  28   0
##     8     0  32   0
##     9     0  47   0
##     10    0  82   0
##     11    0  16   0
##     12    0  12   0
##     13    0  21   0
##     14    0  12   0
##     15    0  20   0
##     16    0  27   0
##     17    0  20   0
##     18    0  15   0
##     22    0  10   0
##     25    0   3   0
##     26    0  14   0
##     27    0  14   0
##     28    0  17   0
##     29    0  17   0
##     30    0   7   0
##     101  30 158 127
##     102  58 131 114
##     103  33 129 139
##     104  37 151 149
##     105  36  93 128
##     106  44 133 139
##     107  48 124 177
##     108  39  99 135
##     109  39  57 107
##     110  45  81 113
##     111  50  66 111
##     112  44  53 139
##     113  41  42 112
##     114  51  10  93
##     115  48  14  92
##     116  36  53  67
##     117  47  48 100
##     118  45  12 129
##     119  52  13 113
##     120  59   0 115
##     121  48  12 138
##     122  53  12 161
##     123  46   0  59
##     124  41   0 147
##     125  45   0 135
##     126  58   0 168
##     127  40   0 141
##     128  60   0 143
##     129  40   0 179
##     130  47   0 127
##     131  23   0  99
##     132  25   0 134
##     133  29   0 153
##     134  34   0 116
##     135  14   0  99
##     136  17   0 169
##     137  15   0 121
##     138  25   0  86
##     139  10   0 141
##     140  12   0 215
##     141   0   0  63
##     142   0   0   5
##     143   0   0 103
##     144   0   0  13
##     146   0   0   5
##     147   0   0   7
##     201  47 131 106
##     202  45 210  69
##     203  37 118  92
##     204  41  75  81
##     205  43  37  72
##     206  38  83  98
##     207  35  41  87
##     208  45  28  75
##     209  49  27  72
##     210  36  40  44
##     211  42  18  59
##     212  40  26  47
##     213  40  16  36
##     214  52   6 138
##     215  34  14  68
##     216  50  80  60
##     217  41  47  56
##     218  62   8  55
##     219  55   8  37
##     220  45   8  39
##     221  36   0  37
##     222  52  42  16
##     223  42   0  45
##     224  45   7  87
##     225  43   7  27
##     226  39   9  14
##     227  38  25  16
##     228  33  20  16
##     229  47  20  15
##     230  46  20  26
##     231  51  19  15
##     232  10   0  16
##     233  18   0  15
##     234  46   0  16
##     235  41  13  16
##     236  31   0  26
##     237  14  28  17
##     238   0  32  16
##     239   0  16  16
##     240   0   0  15
##     241  18   0  27
##     242   0   0  26
##     243   0  17  25
##     244   0  35  16
##     245   0  14  16
##     246   0  14  17
##     247   0  59  23
##     248   0  68  16
##     249   0  25   0
##     250   0   0  15
##     253   0   0   7
##     254   0   0   6

Las salas de la 101 a la 122 se repiten para todos los edificios, sin embargo para el edificio 1, las salas de la 1 a la 30 son exclusivas de éste.

Las salas con identificadores 123-140 se repiten para los edificios 0 y 2, pero no existen (o no se han tomado registros) para el edificio 1.

j

Número de medidas tomadas por cada teléfono:

## .
##    1    3    6    7    8   10   11   13   14   16   17   18   19   22   23   24 
##  495  599 1353  773  893  433  497 3703 2028  192  175  320  583  701 1058  433